AI资讯新闻榜单内容搜索- 大模型

ICML 2026 | 大模型为什么算不对加法？南大团队提出等本位和轨迹，揭示LLM算术错误的几何机制

尽管大语言模型（Large Language Models, LLMs）在复杂数学推理、代码生成和知识问答上表现突出，但它们仍常在多位数加法这类基础算术任务上犯错。

来自主题: AI技术研报

7420 点击 2026-06-17 14:05

在具身智能最难的泛化问题上，他们连续拿出顶会级成果，并把它们沉淀进其创新 VLOA 大模型，推动机器人迈向广阔现实。

来自主题: AI技术研报

9427 点击 2026-06-08 10:45

你有没有想过，我们每天用的 AI 大模型，可能在某些词汇上天生就有缺陷？不是因为训练数据不够，不是因为算力不足，而是因为语言本身的规律——那些用得少的词，模型就是学不好。更让人意外的是，这个问题早在 2025 年就被一家中国创业公司系统性地发现并解决了。

来自主题: AI技术研报

7206 点击 2026-05-28 09:52

姜旭是少数完整参与过 OpenAI 大模型核心技术演进的华人创业者之一。2019 至 2023 年间，他经历了 GPT 系列能力爆发最关键的阶段，工作横跨底层训练 infra、大规模预训练、RLHF 对齐算法与数据构建等核心链路。

来自主题: AI资讯

10653 点击 2026-05-22 10:26

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8447 点击 2026-05-13 15:01

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6471 点击 2026-05-12 14:31

独家获悉，RoboScience 机器科学于近日完成十亿元 A 轮融资，投资方包含多家国内外知名产业巨头及一线财务机构。本轮融资将用于持续深化其核心的 VLOA 大模型技术，以及推进自研机器人本体的工程化与量产，加速通用具身智能解决方案的规模化落地。

来自主题: AI资讯

8811 点击 2026-05-06 09:20

刚看到这个 Demo 的时候着实有些想笑，很久没有见过吐词如此之慢的大模型了。观感上就像「闪电」老师。尽管只有每秒 0.6 个 tokens 的输出速率，这依旧是一个令人不可思议的工作。因为这是一个跑在 iPhone 17 Pro 上的 400B 大模型！

来自主题: AI资讯

10166 点击 2026-05-02 11:02

你敢信？一个活在95年前的AI，竟写出了Python代码。GPT之父下场，用2600亿Token炼出了一个「老古董」AI——「talkie」。

来自主题: AI资讯

8964 点击 2026-04-29 14:43

被动成为新一代 AI 黄埔军校的字节跳动。

来自主题: AI资讯

9785 点击 2026-04-09 09:47